https://www.youtube.com/watch?v=uoVgBnBrE5I
8.결측치.py [Download]
[데이터] 지역 데이터.xlsx [Data Source]
import pandas as pd
df = pd.read_excel('지역 데이터.xlsx')
# 행열 옵션 설정
pd.set_option('display.max_rows', 1000)
pd.set_option('display.max_columns', 20)
# 인덱스 순서 지정
new_index = [str(i) for i in range(1, len(df) + 1)]
df.index = new_index
# 결측치 처리
df['위치'].fillna('발생안함', inplace=True)
df.loc[:, '규모':'위치'] = df.loc[:, '규모':'위치'].fillna('확인중').astype(str)
df.dropna(inplace=True)
# 오름차순 정렬
df.sort_values('평균기온(°C)')
# 내림차순 정렬
df.sort_values('평균기온(°C)', ascending=False)
# 다중 컬럼 정렬
df.sort_values(['평균기온(°C)','월합강수량(00~24h만)(mm)'], ascending=[True, False], inplace=True)
# 특정 데이터 값 수정
df['지역'].replace({'경기도(이천)':'경기도','충청남도(천안)':'충청남도'}, inplace=True)
# 컬럼 추가
df['총합'] = df['평균상대습도(%)'] + df['월합강수량(00~24h만)(mm)']
df['결과'] = 'Fail'
df.loc[df['총합'] > 100, '결과'] = 'Pass'
# 특정 그룹 출력
df.groupby('지역').get_group('충청북도(청주)')
# 데이터 평균
df.groupby('지역').mean()